词嵌入相关论文
命名实体识别是进行文本处理的基础技术手段,深度学习因其强大的学习能力能够挖掘更深层次的文本特征而深受命名实体识别领域研究......
随着网络的普及以及智能设备的广泛使用,海量关于各种事务的文本评价存在于网络当中,并且随着时间的递增,文本的数量也在呈指数形......
作为自然语言处理(Natural Language Processing,NLP)的基础任务,文本分类的目标是用一个或多个类标签对文本进行标注,在信息挖掘和......
如今,电话诈骗案件层出不穷,严重危害到了人们的财产安全和社会的和谐安定。针对社会中的一些诈骗电话问题,提出了一种基于词嵌入和混......
近年来随着个人计算机数量与移动个人终端数量不断攀升,每时每刻都有大量的数据产生。为了更好的处理与利用这些数据,Google公司首......
在软件开发过程中,用户或测试人员在发现被测软件异常情况后,会提交描述相关问题的缺陷报告,开发人员需要仔细分析缺陷报告并查看......
在基于点云和图像的三维模型分类检索中,现有特征融合方法忽略了模态内特征信息和模态间互补信息,存在融合特征丢失的问题,且分类标签......
细菌在次级代谢过程中产生的天然产物具有丰富的化学结构和生物活性,包含着抗生素、抗癌药物和抗病毒药物等多种类型的小分子候选......
随着计算机理论和技术的飞速发展,自然语言处理在日常生活以及学术研究中都变得越来越重要,计算词汇相似度就是其中的一个重要方面......
Internet网络拥有海量的各类电子文本内容,而且还在快速增长,其中隐含大量有价值的信息。通过主题建模从大量文本内发现文本的主题......
在信息过载的大数据时代,推荐系统发展迅速。纵观传统室内空间设计行业,其设计工作的专业性强、人工参与率高,从而导致成本高。人......
深度神经网络(deep neural networks,DNNs)在自然语言处理(natural language processing,NLP)的各个领域特别是情感分析领域已经取得了......
文本分类任务是自然语言处理领域的核心任务。由于拉丁语系本身所具有的天然分词的语法特点,其文本分类等任务已经率先取得了一定......
随着互联网技术的快速发展,在线广告系统已成为各个互联网公司的重要收入来源。广告曝光预估是在线广告系统比较重要的一个环节,其......
文本数据大多数是非结构化数据,如何有效处理和准确表达文本的原始信息在文本分类任务中是首要前提,从非结构转化为结构化数据的过......
分层存储是计算机存储领域的一项重要技术,其核心设计是将数据存储在多层级的存储介质中,通过热点文件识别和数据迁移技术来掩盖访......
越界写入漏洞,又名CWE787,通过该漏洞可以修改索引或执行指针算法,修改缓冲区的边界之外的内存数据。如果后续有写入操作,便会产生......
代码克隆检测是程序质量分析中的一项重要任务,检测出程序中的克隆代码有利于提高软件项目的可维护性,降低程序代码冗余。近年来,......
近年来,恶意代码分析一直都是中国网络安全领域研究的重要课题之一。其中高级可持续威胁攻击(Advanced Persistent Threat,APT)是一......
自动文本摘要是人工智能领域中一个非常重要的研究方向,根据摘要产生方式的不同可分为抽取式摘要和生成式摘要。生成式摘要因为与......
互联网的迅速发展和流媒体音乐服务的强势崛起,使得人们能够随时随地聆听海量音乐。人们享受着信息增长带来数字红利的同时,也面临......
在线社交软件的普及使用正在重塑人们的交流表达方式。人们不再满足于在线下加入能让自己产生归属感的群体或兴趣社团,而将注意力......
数学公式检索是信息检索领域一个重要的研究方向。它的检索对象包含数学公式这种具有复杂的二维结构特征的数据。传统的文本检索方......
中医是重在调理、以预防为主的独特的传统医学,经过代代传承至今。经典医案作为当今中医的成功案例被各大期刊杂志记载,能够对临床......
为了帮助像考古学家、历史学家、网络审查员这类人从文档中快速查找感兴趣的内容,使用深度学习等技术对文档(如手写历史文档)进行快......
命名实体识别(NER,Named Entity Recognition)是自然语言处理的热点方向之一,目的是识别文本中的命名实体,并将其归纳到不同的实体类......
随着深度学习理论的不断发展和完善,基于深度学习的模型逐渐成了近些年自然语言处理技术的主流研究方法。而表征学习是基于深度学......
煤炭是支撑国家战略性发展的重要能源。在山西等地区煤炭交易市场中往往受到地方性政策、业务发展水平和市场服务能力等多种因素限......
通常,在语言学中为避免同一词语反复出现而导致句子结构过于臃肿累赘、语义不清晰等问题,常规方法是利用指代词替代已出现代词或名......
随着互联网技术和社交网络的快速发展,各种网络平台生成了大量用户针对不同领域的评论文本。这些文本包含着丰富的情感倾向,从中可......
中文文本情感分类应用是商家面对用户改进产品的一种重要手段.传统机器学习中one hot编码效率低下且向量十分稀疏,维度很高.文章通......
随着信息科技的发展,网络中的数据规模越来越大,这些数据给现有的检索系统带来了挑战,如何从驳杂的数据信息中检索到准确的答案越......
随着互联网时代的到来,搜索引擎开始被人们普遍使用。在信息检索任务中,针对冷门查询时,由于用户的搜索词范围过小,导致搜索引擎无......
在水利知识图谱的基础上,结合字符串相似度以及word2 vec生成的词嵌入的余弦相似度,设计了关联属性的语义查询算法,实现了异构水利......
近年来,随着互联网技术的日益发展和普及,与个性化推荐相关的服务被广泛应用到生活的方方面面。个性化推荐技术不仅能够从海量信息......
自然语言处理是指利用计算机对文本进行处理,主要包括分析文本(例如:情感分析、文本分类),提取关键信息(例如:关键词抓取)以及利用......
近年来,随着网络技术的进步,互联网的发展以及网络用户数量的增加,网络数据量呈现指数级增长。虽然大量的数据是有价值的,并且其中......
随着Web服务应用的普及,Web服务的数量呈指数级增长,Web服务作为一种可重用、松耦合的分布式计算模型受到了广泛关注。服务市场的......
近年来,短文本已成为互联网信息的普遍形式,尤其是随着在线社交媒体的发展,其数百万的用户每天都会生成大量的短消息。从大量的短......
实体链接是将自然语言中代表实体的字符串与知识库中相应实体对应起来的工作。在网络数据日渐丰富,日常生活与互联网联系日益紧密......
问答系统是新一代的搜索引擎,它可以精确的检索答案给用户,更好的满足用户的查询请求。问句分类是问答系统中一个非常重要的环节,......
文本分类的前提就是文本表示,文本表示的传统方法大多是采用计数的形式,而这种计数的方式认为词与词之间是互相独立存在的,没有考......
人机对话交互在人们的日常生活中越来越普遍,甚至成为人们不可缺少的生活习惯。人机对话包括闲聊式对话、问答型对话、任务型对话......
随着社交网络的快速发展,产生了大量的社交网络文本数据。社交网络文本的立场分析是针对某一话题所发表的评论,分析其对话题的同意......
近年来随着Foursquare、Gowalla、大众点评等基于位置的社交网络服务(Location-Based Social Network,LBSN)的快速增长,越来越多的......